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Abstract of FR2563349 

The multiplier, useable especially for matrixing 
and dematrixing of digital video signals, makes 
it possible to carry out a numerical operation of 
the type A*X + B*Y + C*Z. It comprises a first 
assembly MAT1 consisting of a systolic 
calculating matrix with n x n elementary cells 
(n being the number of coding bits) each 
carrying out an elementary matrix operation 
A*X + B*Y + C*Z, feeding a second assembly 
intended for propagating carries and results of 
elementary calculations for obtaining high- 
significance bits, the second assembly MAT2 
in turn feeding a third assembly consisting of a 
triangular matrix with n register lines for 
presentation of high -significant bits on 
corresponding outputs. 
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(57) Le muftiplieur. utilisabJe notamment pour le matripage et 
le d6matripage de sfgnaux video numariques. permet de r6ali- 
ser una operation numerique du type A*X + B # Y + C # Z. II 
comporte un premier ensemble MAT1 constitue d'une metrics 
de calcul systolique A n x n cellules Slementaires in etant le 
nombre d'eba de codage) realisant chacune una operation 
matricielJe efcmentaire A*X + B*Y + C # Z. alimentant un 
second ensemble destine a la propagation des retenues et des 
risultats des calculs elementaires d'obtention des ebs de 
poids fort le second ensemble MAT2 alimentant a son tour un 
trolsieme ensemble constitue par una matrice triangulaire d n 
lignes de registres de presentation des ebs de poids fort sur 
de9 sorties correspondantes. 
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Multip lieur matriciel systolique de traitement de 
donnges numgriques 

(.'invention a pour objet un multiplieur matri- 
ciel systolique, permettant de rdaliser de fagon simple, 
repetitive et rapide, une operation nume*rique de type : 

A*X + B*Y + C*Z (i) 

o£j A, B et C sont des variables d'entri§e et X, Y et Z 
sont des coefficients qui peuvent Stre fig<§s ou au con- 
traire programmabl es . 

Un tel multiplieur est utilisable pour traiter 
des donnges et des variables numdriques codSes sur un 
nombre d*616ments binaires (ebs ou bits) quelconque. II 
trouve une application particulierement importante dans 
le traitement de signaux numgriques video, notamment 
pour le matrigage et le d^matrigage de tels signaux ; 
parmi lea autres applications possibles, on peut citer 
le filtrage d'images en temps re*el et l'extraction de 
contours. II faut a ce sujet noter que l'ope~ration 
r6alis£e peut avoir un nombre de termes supgrieur b 
trois et notamment &tre de la forme : 

A*X + B*Y + C*Z + D*W. 

On sait qu'un systeme systolique est ainsi de*- 
nomme* du fait de I'analogie de son f onct ionnement avec 
la distribution du sang sous la commands des battements 
du coeur. Un multiplieur systolique permettant de rSali- 
ser l'opdration numSrique A*X + B*Y + C*Z a 6t6 ddcrit 
par Kung dans "Why systolic architectures 7" - IEEE 
TRANSACTIONS ON COMPUTERS, Janvier 1982, num<§ro special 
sur le calcul en parallele. Ce multiplieur utilise trois 
multiplieurs dans trois cellules dif f <§rent es • II est 
done tres complexe. II en est de m§me des cornbinaisons 
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de multiplieurs numeriques travaillant sur 8 et 16 ebs 
actuellement disponibles : la constitution d'un multi- 
plieur effectuant l'operation A*X «► B*Y + C*Z sur dea 
donnees codees sur 8 ebs exige trois multiplieurs et 
deux additionneurs. 

(.'invention vise & fournir un multiplieur ma- 
triciel systolique permettant de rSaliser une operation 
du type A*X + B*Y + C*Z k une rapidity compatible avec 
les exigences du traitement video numgrique, realisable 
de faQon industrielle avec integration sur micropla- 
quette de silicium, k un coQt plus faible que par asso- 
ciation de composants standard et avec une dissipation 
de puissance moindre. 

Pour cela, l'invention propose un multiplieur 
qui, loin de se borner h juxtaposer des circuits exis- 
tants, associe suivant une approche originale et de 
fagon repetitive des cellules unitaire8 simples, aise- 
ment realisables en technologie N — MOS h longueur de 
canal faible (typiquement 3 pm) permettant d'etteindre 
une frequence d'environ 20 MHz, dans lesquelles la me- 
thods systolique est mise en oeuvre au niveau de l'eie- 
ment binaire. 

Le multiplieur comporte un premier ensemble 
constitue d f une matrice de calcul systolique h n x n 
cellules eiementaires (n etant le nombre d'ebs de 
codage) realisant chacune une operation matricielle 
eiementaire A*X + B*Y + C*2, alimentant un second en- 
semble destine & la propagation des retenues et des 
resultats des calculs eiementaires d'obtention des ebs 
de poids fort ; ce second ensemble alimente h son tour 
un troisifeme ensemble constitue par une matrice trian- 
gulaire h n. lignes de registres de presentation des ebs 
de poids fort sur des sorties correspondan t es . 

Lea registres, qui constituent l'eiement de base 
d'une telle architecture, apportent un avantage impor- 
tant : ils peuvent §tre congus pour autoriser un test du 
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multiplieur par chargement en sdrie de toua les regis- 
tres puis dechargement identique apres un cycle de 
1'horloge qui les commande. 

L*invention sera mieux comprise a la lecture de 
5 la description qui suit de modes particuliers d'ex£cu- 
tion donnas b titre d'exemples non limit-at i f s . La des- 
cription se r£fere aux dessins qui 1 1 accompagnent 9 dans 
lesquels : 

- les Figures 1A et IB dans leur ensemble sont 
10 un schema fonctionnel g£n£ral d'un multiplieur suivant 

l'invention permettant de traiter des variables et des 
coefficients cod£s sur 8 ebs ; 

- la Figure 2 est un schema fonctionnel interne 
d'une cellule de base, d£sign£e par CEL1, du premier en- 

15 semble du multiplieur? 

- les Figures 3, 4 et 5 sont des schemes fonc- 
tionnels de cellules SISmentaires CEL 2, ADD et RG du 
second ensemble du multiplieur ; 

- la Figure 6 est un schema 61ectrique de la 
20 cellule RG de la Figure 5. 

Le multiplieur montre* en Figure 1 peut §tre 
regard^ comme constitue* de trois ensembles MAT 1, RET 2 
et RG 3. 

Le premier ensemble MAT 1 regoit en parallele, a 
25 partir d f un bus h 24 fils, les trois variables A, B et C 
sur des entries identifiers par AO, BO, CO,... A7, B7, 
C7. 11 regoit Sgalement les coefficients constants a 
partir de 24 fils de programme t ion selon le mfiroe format 
que les variables. Cet ensemble MAT 1 est constitue* 
30 d'une matrice a 8 lignes et 8 colonnes de cellules 616- 
mentaires CELl(i,j), oil i et j varient de 0 a 7, a la- 
quelle sont ajout£s (sur la gauche de la Figure) huit 
registres 8. 

L'ensemble MAT 1 est une partie essentielle du 
35 multiplieur. II constitue une matrice de calcul systo- 
lique dont cheque cellule CELl(i,j) r£ali3e une op£r- 
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tion matricielle elSmentairo dont on pourra trouver une 
description complete dans la publication de CARL AC 1 H et 
autres "Description prgliminaire des circuits int£gr£s 
de matrigage et de d£matrigage de signeux video- 
num<§riques" , document du " C.CE.T.T. NT/CNR/VRE/29/83 de 
Juin 1983. 

La cellule eTdmentai re realise les trois multi- 
plications en parellele. On supposera qu'elle traite des 
nombres binaires codds en complement h 2. Clle peut 
alors avoir la constitution montrde en Figure 2. La cel- 
lule comporte des registres dynamiques 616mentaires 10 
months en sdrie et qui peuvent fttre du type demerit plus 
loin en faisant r£fe*rence aux Figures 5 et 6. Les sor- 
ties des registres attaquent un jeu de trois addition- 
neurs a retenue 12, 14 et 16, dgsigngs par ADD3, et un 
additionneur simple 18, dSsigne* par ADD2, par 1' inter- 
mgdiaire d'un jeu de portes. Les entries et sorties sont 
designees sur la Figure 2 par les mdmes symboles que sur 
la Figure 1, mais affect^s d'indices indiquant la 
cellule d'origine ou de destination. 

Des entries "TEST" sont prdvues sur les regis- 
tres 10, comme sur tous les autres registres RG du mul- 
tiplieur. Ces entries sont portges au niveau logique 0 
lorsque le multiplieur doit fonctionner en mode de 
calcul. Dans ce cas, la relation combine toi re entre les 
entries de donn£es et les sorties S est la suivante pour 
la cellule CELl(i,j) : 

S(i+l,j-i) + A(i, j-l)*X(i) + B(i, j-l)*Y(i) ♦ 
C(i,j-l)*Z(i) + Rl(i,J-l) + R2(i-l,j-l) = P2(i,j)22 
+Rl(i,j)2 1 + 5(i,j)2°. 

Les notations sont celles indiqu^ea sur la Fi- 
gure 2 et toutes les donnas appliqudes a uno nr»mr? cel- 
lule appartiennent a l'ensemble 0,1 . 

Le second ensemble RET 2 a pour fonction de 
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terminer la propagation des retenues et les re*sultats 
des calculs intermedial res pour l'obtention des ebs de 
poids fort (MSB). II est constitue* de vingt-deux 
cellules Sltmentaires CEL2 (Figure 3), groupies en une 
5 matrice triangulaire de 8 colonnes et 4 lignes, 
associ£es a quatre addi t ionneurs simples ADO (Figure 4) 
et a un registre RG (Figure 5). 

Cheque cellule courante CEL2(i,j) peut avoir la 
constitution montrde en Figure 3, oCi les entries et sor- 

'0 ties sont encore d£sign£es par les mdmes notations que 
sur les Figures pr6c£dentes, affect^es d'indices indi- 
quant l'origine ou la destination. Elle se compose de 
registres dynamiques 20 montds en cascade, d'un addi- 
tionneur simple 22 et d'un additionneur a retenue 24. 

•5 De mfime, cheque cellule ADD (Figure 4) peut §tre 

constitute de deux registres dynamiques 26 en cascade 
dont les sorties attaquent un sommateur 2B fournissant 
le signal de sortie, dirige* vers la premiere cellule 
CEL2 d'une ligne (pour quatre des cellules ADD), four- 

20 nissant le dernier c§16ment binaire de poids fort 57 du 
rtsultat (pour la derniere cellule ADD). 

Enfin, le registre RG a une constitution qu'on 
peut retrouver dans les registres du troisieme ensemble 
RG3. Du point de vue fonctionnel (Figure 5), il peut 

25 §tre consid£re* comme constitue^ d'inverseurs 30 relics 
par des interrupteurs commandos par des horloges de 
cadencement non recouvrantes a l'£tat haut (indiquges 
par Fi et F2) et le signal de test. II peut avoir la 
constitution Slectrique montrge en Figure 6 oti les 

30 entrees-sorties portent les mfimes references que sur la 
Figure 5. 

Enfin, le troisiferoe ensemble RG3 est dentine a 
fournir les ebs de poids fort du rdsultnt nur des 
sorties 50-56. II eat constitue* d'une matrice triongu- 
35 laire a 7 lignes et 4 colonnes de dix-neuf regintres RG 
qui peuvent fitre identiques a ceux montr^s par les 
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Figures 5 et 6. Les registros RG sont commandos par les 
mSmes horloges que les registres des cellules de*ja d6- 
crites, lis permettent le f one t ionnement systolique du 
mul tiplieur . 

Le rOle des composants apparattra mieux en con- 
sidgrant le f onct ionnement global du mult iplieur , qui 
sera maintenant ^voqu^. 

Les huit cellules d'entrSe CELl(0,i) qui 
regoivent chacune trois ebs de poids identiques Ai, Bi v 
Ci des variables d'entrSe, traitent ces ebs au niveau 
haut de I'horloge Fl qui suit la presence des ebs aur le 
bus d'entrSe. 

Les trois entries de coefficient de chaque 
cellule CELl(i,j) (entries horizontales sur la Figure 1) 
regoivent les coefficients selon le m6me format que les 
variables, e'est-a-dire le triplet Xi, Yi, Zi des ebs de 
m§me poids pour toutes les cellules d'une m&me colonne 
En d'autres termes, les cellules CELl(0,i) a 
CELl(7,i) regoivent les m§mes ebs Xi, Yi, Zi, 

A chaque niveau haut de I'horloge Fl, un nouveau 
triplet de variables numSriques A, B, C est introduit 
dans la premiere ligne de cellule CELl(0,i). Les r£sul- 
tats partiels se propagent dans le multiplieur au rythme 
du signal d'horloge. La traversge synchrone des treize 
Stages successifs est assur£e par les registres RG com- 
mandos par la double horloge Fl et F2 ne prgsentant pas 
de recouvrement a l'Stat haut. 

A chaque cycle d'horloge, apres traversde de 
tous les Stages, les rSsultats de 1'opSration A*X + B*Y 
+ C*Z sont presents sur les fils de sortie 50 a 57 
(Figure 1). Les sorties P0 a P9 qui rnp rSsen t en t les 
poids faibles du rSsultet sur 17 ebs ne sont pas prises 
en compte dans le cas montre* en Figure 1. Elles 
pourraient l'§tre en augmentant la taille de l'ensemble 
RG3 - 

L'opSration logique est done effectuSe en 13 
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cycles d'horloge pour des donnges (variables et coeffi- 
cients coddes sur 8 ebs. II s'y ajoute le cycle d'hor- 
loge de l'Stage de sortie du circuit intSgre*. 

En mode "calcul" ( traitement cont inu de donnges 
numSriques), tout se passe comme si l f op£rateur effec- 
tuait un calcul a cheque cycle d'horloge. 

II peut §tre utile a ce stade de faire appa- 
raitre le f onctionnement de chaque cellule £l£mentaire 
CELl(i,j) en mode "calcul" et en mode "test". 

En mode calcul (Figure 2), lorsque l'entrge 
"test" est au niveau logique z6ro 9 les entries de 
donndes de la cellule d'ordre (i,j) : 

S(i+1, j-1) 
RKi, j-1) 
A (i, j-1) 
B (i f j-1) 
C (i, j-1) 
R2U-1, j-1) 

sont chargdes dans les registres 10 lorsque l'entr£e 
d'horloge Fl est a 1, l'entr£e F2 Stant alors a 0. Cha- 
que registre 10 continue a m^moriser dans sa partie es- 
clave la valeur binaire de I'entrge quand Fl repasse a 0 
et que F2 reste b 0* Les sorties des registres 10 
prennent les valeurs des entries pr6c6demment chargges 
quand l'horloge F2 passe a 1 et que Fl reste h 0. Les 
sorties sont alors calculdes dans le r£seau combinatoire 
constitute des quatre addit ionneurs 12, 14, 16 et 18* 

Cette ddcoupe f onct ionnelle du r£seau combina- 
toire est optimale du point de vue de la minimisation de 
la consommation en courant et de la minimisation de la 
surface de la cellule inte'gre'e sur semiconduc t eur . La 
cellule CEL1 assure nganmoins une rapidite* compatible 
avec la frequence de 20 MHz des horloges biphasges (Fl^ 
F2) non recouvrantes a l'Stat 1. 



10 



15 



20 



25 



30 



2563349 

n 

Comme on l'a deja indique plus haut, il eat in- 
portant du point de vue de 1 ' induatrialiaation que le 
multiplieur puisse etre complfetement teaU de fecon 
simple. Ce r<Ssultat eat atteint, dans l'invention, en 
prevoyant une entree de test qui permet, loraqu'elle eat 
mise au niveau logique 1, de modifier le aena dea trene- 
fert8 d'informetion dans les cellules. 

Loraque l'entree TEST eat a zero, toua lea 
regiatrea RG sont connectea en parallele (mode de cel- 
cul). Lorsque l'entree TEST est a 1, toua lea registres 
RG sont connects en serie, ce qui permet : 

- de charger tous lea registres RG avec l'entree 
marquee "Entree serie", apres dea decalagee commandea 
par (Fl, F2). Le contenu des registres RG eat done ob- 
servable a la sortie "Sortie serie" de la cellule, ce 
qui rend le teat dea regiatrea RG tree aimple, exheuatif 
et rapide, 

- de poaitionner les sorties des registres RG 
afin de presenter tous les caa poasiblea de configura- 
tions des entries logiques du reaeau d ' addi tionneura . 
Apres chargement dana les registres des cellules sui- 
vantea, les resultats logiques du reaeau d' additionneura 
sont observables aur la aortie "Sortie aerie", aprea dea 
decalagea commandes par (Fl, F2). Le teat de la cellule 
pour verifier qu'elle assume la fonction combinatoire 
requiae est done ggalement simple, exhauatif et rapide. 

L'invention eat ausceptible de nombreuses va- 
riantes et peut a'etendre h la realisation d'un opera- 
teur h plua de trois termea et au traitement de donneea 
num^riquea cod^es sur un nombre d'ebs quelcon<jue. 

II faut remarquer b ce aujet que 1 ' augmentat ion 
de trois & quatre du nombre de termea n'accrolt nl la 
taille, ni la complexity du schema global. On passe b 
l'operateur & quatre termes : 
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A*X + B*Y + C*Z + D*W 
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par une modification mineure de 1 1 additionneur 18 a deux 
entries (Figure 2) pour le transformer en un addition- 
neur a trois entrdes et conduire la cellule Sldmentaire 
a remplir la relation combinatoire : 

5 S(i+j,j-l)}+ A(i,j-l)»X(l) + B(i f j-l)*Y(i) + 
C(i,j-l)*Z(i) + D(i,j-l)*W(j) + Rl(i,j-1) + R2(i-l,j-l) 
= R2(i,j)2 2 + Rl(i,j)2 1 + 5(i,j)2 0 

Quant a 1 1 augmentation du nombre d'ebs de co- 
10 dage, elle conduit a modifier uniquement la taille, et 
non la structure, du multiplieur. Le temps de calcul 
instantane* n'est pas modifie* : seul le nombre de cycles 
d'horloge ndcessaire au calcul complet varie avec la 
taille de l'ope>ateur. 
15 I ' implantation du multiplieur en tecbnologie 

N.MOS sur silicium en un seul circuit intSgre" peut se 
faire sans difficulty et on notera l'avantage que repr<§- 
sente le fait que les connexions aient lieu entre cel- 
lules mi toyennes • 
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REVEND1CATI0NS 

1. Multiplieur matriciel systolique permettant 
de r^aliser une operation numdrique du type : 

A*X + B* Y + C*Z 

5 caract£ris£ en ce qu'il comporte un premier ensemble 
(MAT1) constitue* d'une matrice de calcul systolique a n 
x n cellules £16mentaires (in 6tant le nombre d'ebs de 
codage) r£alisant chacune une operation matricielle 
e*l£mentaire A*X ■•- B*Y + C*Z, alimentant un second ensem- 

10 ble destine* a la propagation des retenues et des r^sul- 
tats des calculs 61gmentaires d'obtention des ebs de 
poids fort, le second ensemble (MAT2) alimentant a son 
tour un troisifcme ensemble constitue* par une matrice 
triangulaire h n lignes de registres de presentation des 

15 ebs de poids fort sur des sorties cor respondantes . 

2. Multiplieur matriciel systolique suivant la 
revendication 1, caract£rise' en ce que cheque cellule 
(CEL1) du premier ensemble comporte des registres dyne- 
miques (10) connectables en s£rie ou en parallfele, dont 

20 les sorties attaquent quatre additionneurs. 

3. Multiplieur matriciel systolique suivant la 
revendication 1 ou 2, caract£rise* en ce que le second 
ensemble (MAT2) est constitue* par une matrice triangu- 
laire a n colonnes de cellules 61t§mentaires (CEL2) 

25 associates a des additionneurs simples (ADD) et a un re- 
gistre dynamique. 

4. Multiplieur matriciel systolique suivant la 
revendication 3, caractgrisg en ce que chaque cellule 
(CEL2) du second ensemble $e compose de registres dyna- 

30 miques (20) months en cascade, d'un additionneur a deux 
entries (22) et d'un additionneur a trois entries (24), 

5. Multiplieur matriciel suivant 1 1 une quelcon- 
que des re vendicat ions 1 a 4, carac te'rise' en ce que le 
troisieme ensemble (RG3) ost constitue" d'une matrice 

35 triangulaire a n-1 colonnes de registres nomm«ndes f en 
m§me temps que les autres registres du multiplieur par 
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deux horloges synchrones de cadencement non recouvrantes 
h l'£tat haut, permettant le f onctionnement systolique 
et formant les ebs de poids fort du r£sultat» 

6. Multiplieur matriclel suivant l'une quelcon- 
5 que des revendications 2 a 5, caractSrise" en ce que tous 

les registres sont munis d'une entree de test permettant 
de modifier les transferts d ' inf ormat ion dans les cel- 
lules. 

7. Multiplieur matriclel suivant l'une quelcon- 
10 que des revendications pr6c£dentes, caractgrise* en ce 

que cheque cellule 616mentaire (CEL1) du premier ensem- 
ble est pr£vue pour r€aliser entre ses entries E et ses 
sorties S la relation combinatoire x 
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S(i+l,j-l) + A(i,j-l)*X(i) + B(i, j-l)*Y(i) + 
C(i,j-l)*Z(i) + Rl(i t J-l) + R2(i-l,j-l) = R2(i,j)2 2 
+Rl(i, j)2 ! + S(i, j)2 D . 
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